如果不正确地进行,无监督的自我锻炼练习和体育训练可能会造成严重伤害。我们介绍了一个基于学习的框架,该框架可以识别用户犯的错误,并提出纠正措施,以更轻松,更安全的个人培训。我们的框架不依赖于硬编码的启发式规则。取而代之的是,它从数据中学习,这有助于其适应特定用户需求。为此,我们使用作用于用户姿势序列的图形卷积网络(GCN)体系结构来模拟身体关节轨迹之间的关系。为了评估我们的方法,我们介绍了一个具有3种不同体育锻炼的数据集。我们的方法产生了90.9%的错误识别准确性,并成功纠正了94.2%的错误。
translated by 谷歌翻译
我们提出了一种生成,预测和使用时空占用网格图(SOGM)的方法,该方法嵌入了真实动态场景的未来语义信息。我们提出了一个自动标记的过程,该过程从嘈杂的真实导航数据中创建SOGM。我们使用3D-2D馈电体系结构,经过训练,可以预测SOGM的未来时间步骤,并给定3D激光镜框架作为输入。我们的管道完全是自我监督的,从而为真正的机器人提供了终身学习。该网络由一个3D后端组成,该后端提取丰富的特征并实现了激光镜框架的语义分割,以及一个2D前端,可预测SOGM表示中嵌入的未来信息,从而有可能捕获房地产的复杂性和不确定性世界多代理,多未来的互动。我们还设计了一个导航系统,该导航系统在计划中使用这些预测的SOGM在计划中,之后它们已转变为时空风险图(SRMS)。我们验证导航系统在模拟中的能力,在真实的机器人上对其进行验证,在各种情况下对真实数据进行研究SOGM预测,并提供一种新型的室内3D LIDAR数据集,该数据集在我们的实验中收集,其中包括我们的自动注释。
translated by 谷歌翻译
大多数流行的尺寸降低(DR)方法(例如T-SNE和UMAP)是基于最大程度地减少输入和潜在成对相似性之间的成本。尽管被广泛使用,但这些方法缺乏明确的概率基础,可以充分了解其特性和局限性。在这个程度上,我们基于使用交叉熵的隐藏图耦合引入了一个统一的统计框架。这些图在输入和潜在空间中的观测值之间诱导了马尔可夫随机场依赖关系结构。我们表明,现有的成对相似性DR方法可以从我们的框架中检索到图形的特定选择。此外,这表明这些方法遭受了统计缺陷的影响,该缺陷解释了保存粗粒依赖性方面的性能不佳。我们的模型被利用并扩展到解决此问题的同时,在使用Laplacian eigenmaps和PCA绘制新链接时。
translated by 谷歌翻译
多模式问题是现实世界中的全部问题:自主驾驶,机器人抓住,场景理解等......我们从相似性的良好分析中得出了一个例子,以提供神经网络从不同传感器培训的问题,以及哪里从这些传感器中提取的特征仍然携带类似的信息。更确切地说,我们证明了对于每个传感器,来自与其他传感器最多相关的最后层的特征的线性组合对应于分类层的分类组件。
translated by 谷歌翻译
We present Kernel Point Convolution 1 (KPConv), a new design of point convolution, i.e. that operates on point clouds without any intermediate representation. The convolution weights of KPConv are located in Euclidean space by kernel points, and applied to the input points close to them. Its capacity to use any number of kernel points gives KP-Conv more flexibility than fixed grid convolutions. Furthermore, these locations are continuous in space and can be learned by the network. Therefore, KPConv can be extended to deformable convolutions that learn to adapt kernel points to local geometry. Thanks to a regular subsampling strategy, KPConv is also efficient and robust to varying densities. Whether they use deformable KPConv for complex tasks, or rigid KPconv for simpler tasks, our networks outperform state-of-the-art classification and segmentation approaches on several datasets. We also offer ablation studies and visualizations to provide understanding of what has been learned by KPConv and to validate the descriptive power of deformable KPConv.
translated by 谷歌翻译